AWS AI chips deliver high performance and low cost for Llama 3.1 models on AWS
今天,我们很高兴地宣布 AWS Trainium 和 AWS Inferentia 支持 Llama 3.1 模型的微调和推理。Llama 3.1 系列多语言大型语言模型 (LLM) 是一组预先训练和指令调整的生成模型,大小分别为 8B、70B 和 405B。在上一篇文章中,我们介绍了如何在 Amazon SageMaker JumpStart 中基于 AWS Trainium 和 Inferentia 的实例上部署 Llama 3 模型。在这篇文章中,我们概述了如何开始在 AWS AI 芯片上微调和部署 Llama 3.1 系列模型,以实现其性价比优势。
Llama 3.1 models are now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布,最先进的 Llama 3.1 多语言大型语言模型 (LLM) 集合(包括 8B、70B 和 405B 大小的预训练和指令调整生成式 AI 模型)可通过 Amazon SageMaker JumpStart 部署以进行推理。Llama 是一种可公开访问的 LLM,专为开发人员、研究人员和企业设计,用于构建、试验和负责任地扩展他们的生成式人工智能 (AI) 创意。在这篇文章中,我们将介绍如何使用 SageMaker JumpStart 发现和部署 Llama 3.1 模型。
随着数字商务的扩展,欺诈检测已成为保护参与在线交易的企业和消费者的关键。实施机器学习 (ML) 算法可以实时分析大量交易数据,以快速识别欺诈活动。这种先进的功能有助于降低金融风险并在不断扩展的数字市场中保护客户隐私。德勤是一家全球战略 […]
Amazon SageMaker unveils the Cohere Command R fine-tuning model
AWS 宣布在 Amazon SageMaker 上推出 Cohere Command R 微调模型。SageMaker 机器学习 (ML) 功能套件的最新成员使企业能够利用大型语言模型 (LLM) 的强大功能,并充分发挥其在各种应用中的潜力。Cohere Command R 是一种可扩展的前沿 […]
Derive meaningful and actionable operational insights from AWS Using Amazon Q Business
作为客户,您依赖 Amazon Web Services (AWS) 的专业知识来随时待命并了解您的特定环境和运营。今天,您可能会实施手动流程来总结经验教训、获得建议或加快事件的解决。这可能很耗时、不一致且不易访问。这篇文章展示了如何 [...]
在当今快速发展的人工智能 (AI) 领域,训练大型语言模型 (LLM) 带来了重大挑战。这些模型通常需要大量的计算资源和复杂的基础设施来处理所涉及的大量数据和复杂算法。如果没有结构化的框架,这个过程可能会变得非常耗时、昂贵和复杂。企业在管理方面苦苦挣扎 […]
Governing the ML lifecycle at scale, Part 2: Multi-account foundations
您的多账户策略是 AWS 上基础环境的核心。围绕多账户环境的设计决策对于大规模安全运营至关重要。将您的工作负载战略性地分组到多个 AWS 账户中,使您能够跨工作负载应用不同的控制、跟踪成本和使用情况、减少账户限制的影响并降低复杂性 […]
Video auto-dubbing using Amazon Translate, Amazon Bedrock, and Amazon Polly
这篇文章由 MagellanTV 和 Mission Cloud 共同撰写。视频配音或内容本地化是在同步音频和视频的同时用另一种语言替换视频中原始口语的过程。视频配音已成为打破语言障碍、增强观众参与度和扩大市场覆盖范围的重要工具。然而,[…]
How Mixbook used generative AI to offer personalized photo book experiences
几年前,Mixbook 采取了一项战略举措,将其运营工作负载转移到 Amazon Web Services (AWS),此举不断带来显著优势。这一关键决定在推动他们完成使命方面发挥了重要作用,确保他们的系统操作具有可靠性、卓越性能和运营效率。在这篇文章中,我们将向您展示 Mixbook 如何使用 AWS 中的生成人工智能 (AI) 功能来个性化他们的相册体验——这是他们实现使命的一步。
这篇文章是与 BRIA AI 的 Bar Fingerman 共同撰写的。这篇文章解释了 BRIA AI 如何快速且经济地在包含 PB 级许可图像的数据集上训练高分辨率 (1024×1024) 文本到图像传播模型 BRIA AI 2.0。Amazon SageMaker 训练作业和 Amazon SageMaker 分布式训练库承担了与基础设施相关的无差别繁重工作 [...]
Amazon Bedrock 的知识库是一项完全托管的服务,可帮助您实施从提取到检索和快速增强的整个检索增强生成 (RAG) 工作流,而无需构建自定义数据源集成和管理数据流,从而突破了您在 RAG 工作流中可以做的事情的界限。然而,它是 [...]
今天,我们很高兴推出 Amazon Bedrock 的两个强大新功能:Prompt Management 和 Prompt Flows,公开预览版。这些功能旨在加速生成式人工智能 (AI) 应用程序的开发、测试和部署,使开发人员和业务用户能够创建更高效、更有效且更易于维护的解决方案。您 [...]
想象一下——所有员工都依靠生成式人工智能 (AI) 来更快地完成工作,每项任务都变得不那么平凡,更具创新性,每个应用程序都提供更实用、更个性化、更引人入胜的体验。为了实现这一未来,组织需要的不仅仅是一个强大的大型语言模型 (LLM) 或聊天助手。他们需要一个 [...]
A progress update on our commitment to safe, responsible generative AI
负责任的 AI 是亚马逊的一项长期承诺。从一开始,我们就将安全性、公平性、稳健性和隐私性嵌入到我们的开发流程中并教育我们的员工,从而优先考虑负责任的 AI 创新。我们努力改善客户的生活,同时建立和实施必要的保障措施来保护他们。我们实用的 […]
随着生成式人工智能 (AI) 推理对企业越来越重要,客户正在寻求扩展其生成式 AI 操作或将生成式 AI 模型集成到现有工作流程中的方法。模型优化已成为一个关键步骤,使组织能够平衡成本效益和响应能力,从而提高生产力。但是,性价比要求在不同用例之间差异很大。对于 [...]
今天,Amazon SageMaker 宣布了一款新的推理优化工具包,可帮助您将优化生成式人工智能 (AI) 模型所需的时间从数月缩短到数小时,从而为您的用例实现一流的性能。借助这项新功能,您可以从优化技术菜单中进行选择,将它们应用于您的生成式 AI [...]
Anthropic’s Claude 3.5 Sonnet ranks number 1 for business and finance in S&P AI Benchmarks by Kensho
Anthropic Claude 3.5 Sonnet 目前在 Kensho 的 S&P AI 基准中名列前茅,该基准评估了金融和商业的大型语言模型 (LLM)。Kensho 是 S&P Global 的 AI 创新中心。借助 Amazon Bedrock,Kensho 能够快速运行 Anthropic Claude 3.5 Sonnet 以应对一系列具有挑战性的业务和财务挑战 […]
The Weather Company enhances MLOps with Amazon SageMaker, AWS CloudFormation, and Amazon CloudWatch
在本文中,我们分享了 The Weather Company (TWCo) 如何使用 Amazon SageMaker、AWS CloudFormation 和 Amazon CloudWatch 等服务增强其 MLOps 平台的故事。TWCo 数据科学家和 ML 工程师利用自动化、详细的实验跟踪、集成训练和部署管道来帮助有效扩展 MLOps。TWCo 将基础设施管理时间缩短了 90%,同时还将模型部署时间缩短了 20%。